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28 dicembre 2023—Nella scorsa puntata siamo riusciti ad archiviare docu- 
menti ,janche grandi ed in formati eterogenei, e convertendoli durante il processo 
in modo da averli disponibili in più formati digitali, riutilizzabili per gli scopi 
più diversi. 

Ma per poter dire di aver realmente archiviato un documento bisogna anche 
averlo inserito in un più vasto corpo di documenti, a sua volta dotato di indici 
e metodi di vario tipo per organizzare e ricercare i documenti e le informazioni 
in essi contenute. 


Facile quindi cogliere l’importanza di sapere a priori come una biblioteca digitale 
già esistente permette di organizzare i propri dati, adeguandosi ad utili e ben 
studiati standard comuni. 


L’architettura di Internet Archive è tanto semplice quanto potente. 


Il primo livello dell’architettura è l’oggetto, che può essere creato e suc- 
cessivamente modificato in vari modi; un oggetto è tipicamente un singolo doc- 


umento. Se l’oggetto viene creato da un utente registrato e collegato, all’utente 
viene assegnato il ruolo di amministratore dell’oggetto, che può quindi modifi- 
carlo, arricchirlo di ulteriori file di dati e nuovi metadati, e così via. Se l’oggetto 
viene invece creato in forma anonima da un utente non registrato o non collegato, 
ad esempio utilizzando la Wayback Machine, non può più essere modificato da 
chi lo ha creato, ma solo dagli amministratori di Internet Archive, dietro speci- 
fica richiesta da inoltrare via email, formattata con specifici template. 


Il secondo (ed ultimo!) livello di architettura è la collezione (Collec- 
tion). Una collezione è un oggetto di tipo particolare, formato solo da riferi- 
menti ad altri oggetti. Come tutti gli oggetti è dotato di suoi propri metadati, 
ma può essere creato solo dagli amministratori di Internet Archive dietro speci- 
fica richiesta di un utente registrato, utente che deve possedere certi requisiti, 
elencati nelle policy di creazione delle collection. Una collezione può contenere 
altre collezioni come sotto-collezioni. L'utente che si è fatto creare ed assegnare 
la collezione la può amministrare, inserendoci gli oggetti di cui è il creatore, ad 
esempio quelli che ha uploadato. 


Quando un oggetto viene creato, viene assegnato per default ad una collezione; 
se l’oggetto è creato in maniera anonima o direttamente da un utente tramite up- 
load, viene assegnato automaticamente ad una collezione che potremmo definire 
“di sistema”. 


Ad esempio i documenti che abbiamo creato nelle precedenti puntate, come si 
può vedere esaminando i metadati nella finestra dell’oggetto o tramite il meta- 
data editor, sono stati assegnati per default alla collezione “opensource”. Ri- 
corderete che il file dell’articolo usato è stato da noi specificatamente marcato 
come oggetto effimero e destinato ad essere cancellato dopo 30 giorni. Esami- 
nando i suoi metadati, si può notare che è stato assegnato anche alla collezione 
test_collection. Un processo automatico, evidentemente, “spazzola” tutti gli 
oggetti assegnati a questa collezione e rimuove definitivamente quelli più vecchi 
di 30 giorni. 


Esiste uno pseudo “terzo livello” di organizzazione che è solo di “presentazione”, 
e viene costruito dai creatori del sito assegnando gli oggetti a collezioni par- 
ticolari ed utilizzandole poi per generare specifiche pagine sul sito di Internet 
Archive, per favorire un accesso rapido ed estemporaneo a certe categorie di 
informazioni. Queste sono, ad esempio, le icone che si trovano in home page e 
sulla barra dei menu del sito. 


Internet Archive is a non-profit library of 
millions of free books, movies, software, 
music, websites, and more. 


soft BOoOBHle®gs 


8438 39M 11M 15M 2.6M 1.1M 4.8M 257K 2.1M 


Advanced Search 


Il sito di Internet Archive ha un’aria un po’ “farraginosa” e retrò. In effetti però, 
appena preso un minimo di confidenza, si rivela un meccanismo abbastanza utile 
e potente per trovare documenti di interesse od avere spunti di cose nuove, che 
sono di solito collezioni molto accedute. 


In realtà, comunque, le informazioni di interesse si trovano, come è facile im- 
maginare trattandosi di una biblioteca, tramite le funzioni di indicizzazione e 
ricerca, rese disponibili in vari modi sul sito. Ad esempio, visualizzando i propri 
upload, nella parte sinistra dello schermo si ha accesso ad una serie di categorie 
di selezione pertinenti, simili a quelle di Amazon. 
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Quando necessario, si può accedere direttamente alla funzione di ricerca tramite 
il box “Search” in alto a destra nel sito. Si può accedere alla funzione di ricerca 
completa cliccando dentro il box stesso e selezionando” advanced search”. 


INTERNET 
ARCHIVE 


Advanced Search 
This form allows you to perform an advanced search. You only need to fill in one field below. This can be any field. If you select “not” as your match criteria, you must 
select one other field. 

Any field: contains 


AND Titte contains v 

AND Creator contains A 

AND Description: contains x 

AND Collection: is {~ 

AND Mediatype: is v All mediatypes v 

AND contains 5 

AND contains ~ 

AND contains v 

AND Date: YYYY ~ IMM ~ DD v 

AND Date range: YYYY < || MM <|\DD ~|TO|YYYY ~||MM ~ ||D0 v 


Advanced Search returning JSON, XML, and more 


This will return results in the format of your choice. 
Query 


Fields to return (pick one or more) (optional) Sort results by: 


Ed anche per oggi è tutto. Stay tuned per la prossima puntata di “ Archivismi”. 


Scrivere a Cassandra—Twitter—Mastodon 
Videorubrica “Quattro chiacchiere con Cassandra” 

Lo Slog (Static Blog) di Cassandra 

L’archivio di Cassandra: scuola, formazione e pensiero 
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